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摘要 芯片 是 现代 信息 社会 的 关键 基础 设施 ， 未 来 人 机 物 三 元 融合 的 智能 万 物 互 联 时 代 将 需要 大 量 不 同 种 类 
的 专用 体系 结构 芯片 。 然 而 ， 芯 片 设计 本 身 代 价 很 高 ， 具 有 设计 周期 长 、 过 程 非常 复杂 、 专 业 门 槛 高 的 特 
上 点。 因此， 智能 万 物 互联 时 代 芯 片 需 求 多 和 芯片 设计 代价 高 之 间 产 生 了 巨大 的 矛盾 。 文 章 提出 利用 芯片 学 习 
(Chip Learning) 来 取代 芯片 设计 以 解决 上 述 了 矛盾 ， 即 采用 学 习 的 方法 来 完成 芯片 从 逻辑 设计 到 物理 设计 的 
全 流程 。 芯 片 学 习 的 目标 是 通过 学 习 使 得 芯片 设计 完全 不 需要 专业 知识 和 设计 经 验 ， 可 以 在 短 时 间 、 无 人 参 


与 的 情况 下 高 效 完成 。 
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芯片 是 现代 信息 社会 的 关键 基础 设施 。 绝 大 部 分 
的 电子 设备 一 一 小 到 传感器 、 大 到 超级 计算 机 ， 以 
及 我 们 每 天 用 的 手机 、 电 脑 ， 都 是 建立 在 芯片 基础 
之 上 的 。 从 20 世纪 60 年 代 开 始 ， 随 着 半导体 工艺 的 
发 展 ， 芯 片 的 复杂 度 快 速 增 加 ， 从 只 有 人 少数 晶体 管 的 
小 规模 开始 快速 发 展 到 千 百 万 、 数 十 亿 晶体 管 规模 。 
例如 ，2020 年 英 伟 达 (Nvidia) 发 布 的 A100 芯片 集 
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成 了 500 多 亿 晶 体 管 。 芯 片 制造 工艺 也 已 经 接近 量子 
领域 ， 台 积 电 (TSMC ) 的 5 nm 工艺 已 经 开始 量 产 心 
F, 英特尔 ( Intel ) 等 厂商 已 经 开展 2 nm 工艺 的 芯片 
人 研究。 这 些 都 离 不 开 芯片 设计 的 快速 发 展 。 

芯片 设计 本 身 是 一 个 代价 很 高 的 过 程 。 即 使 经 过 
了 40 多 年 的 发 展 ， 也 集成 了 越 来 越 多 的 先进 算法 ， 
芯片 设计 仍然 是 一 个 周期 非常 长 、 过 程 非常 复杂 、 对 
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设计 人 员 专 业 度 要 求 很 高 的 任务 。 芯 片 制造 本 身 的 高 
额 费 用 也 加 剧 了 对 于 世 片 设计 的 要 求 。 通 常 整个 必 片 
设计 流程 ， 从 立项 到 最 后 交付 流 片 ， 中 间 涵 盖 了 逻辑 
设计 、 电 路 设计 等 复杂 过 程 ， 大 致 需要 1 一 1.5 年 的 时 
间 ， 需 要 包括 系统 设计 人 员 、 芯 片 设计 人 员 、 芯 片 开 
发 人 员 、 蕊 片 验证 和 测试 工程 师 在 内 的 多 名 专业 人 员 
紧密 地 协作 开发 。 

未 来 万 物 互 联 的 智能 时 代 需 要 大 量 不 同 种 类 的 专 
用 芯片 。 随 着 智能 时 代 的 到 来 和 “摩尔 定律 ”的 大 
幅度 放 缓 ， 专 用 必 片 的 数量 和 种 类 大 幅度 增加 ， 蕊 
片 体 系 结构 将 要 进入 新 的 黄金 时 代 "， 这 对 芯片 设计 
提出 了 更 大 的 挑 成 。 目 前 ， 深 度 学 习 处 理 需 忆 片 就 有 
很 多 种 。 例 如 : 国外 ， Aa (Google) Wi T TPU, 
英 伟 达 推出 DLA 和 包含 专用 加 速 TensorCore 的 多 
ak GPGPU ， 英 特 尔 收购 了 Neverana, Movidius 等 多 
ZH], ARM, i (Qualcomm ) , 2432 ( Apple ) 
等 公司 的 系统 级 芯片 ( SoC ) 也 各 自 集成 了 自家 的 深 
度 学 习 加 速 器 硬件 ; 国内 ， 中 科 寒 武 纪 科技 公司 推出 
了 Cambricon 云 边 端 系列 芯片 ， 阿 里 巴巴 公司 推出 了 
含 光 NPU， 华 为 公司 推出 了 达 分 奇 架 构 世 片 等 。 据 统 
计 ， 从 2014 年 开始 ， 全 球 深度 学 习 处 理 需 必 片 就 从 一 
两 款 增长 到 了 几 百 款 之 多 中。 未 来 万 物 互联 的 智能 时 
代 对 于 大 量 种 类 和 数量 的 芯片 需求 ， 也 对 世 片 设计 效 
率 提出 了 新 的 挑战 。 

如 何 解 决 芯 片 设计 需求 多 和 芯片 设计 代价 高 之 间 
的 矛盾 ?其 中 ， 最 关键 的 问题 是 芯片 设计 领域 对 设计 
人 员 的 专业 水 平 要 求 比较 高 ， 既 包括 专业 知识 ， 也 包 
括 从 业 设 计 经 验 。 如 果 蕊 片 设计 的 “门槛 ”能 降下 
来 ,那么 任何 一 个 稍 加 培训 的 硬件 设计 人 员 就 可 以 如 
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同 编写 软件 程序 一 样 快速 地 完成 芯片 设计 。 本 文 提出 
芯片 学 习 (Chip Learning ) 来 取代 芯片 设计 可 解决 上 
述 矛 盾 ， 即 采用 学 习 的 方法 来 完成 芯片 从 逻辑 设计 
到 物理 设计 的 全 流程 。 简 而 言 之 ，Chip Learning 针对 
这 样 一 类 问题 : 输入 是 简单 的 功能 需求 描述 (或 者 
芯片 的 硬件 程序 ) ， 而 输出 则 是 电路 的 物理 版 图 。 
Chip Learning 通过 学 习 已 有 芯片 设计 进行 训练 ， 根 据 
输入 生成 满足 要 求 的 电路 物理 版 图 。 我 们 希望 Chip 
Learning 学 习 到 的 模型 在 使 用 时 完全 不 需要 专业 知识 
和 设计 经 验 ， 可 以 在 短 时 间 、 无 人 参与 的 情况 下 完成 
芯片 设计 。 本 文 首先 介绍 现 有 芯片 设计 的 流程 ， 同 时 
介绍 近 几 年 人 工 智能 CAT) 技术 在 芯片 设计 中 的 应 
用 ， 在 此 基础 上 说 明 实 现 Chip Learning 的 思路 和 面临 
的 挑战 。 


1 芯片 设计 流程 和 Chip Learning 
1.1 芯片 设计 流程 

芯片 设计 是 一 个 复杂 的 过 程 。 通 和 常 ， 沪 片 设计 
指 的 是 从 需求 出 发 最 后 生成 版 图 (layout ) 的 过 程 。 
典型 的 芯片 设计 流程 可 以 被 简单 地 划分 成 5 个 阶段 
(图 1) : (D 系统 定义 (chip specification) 。 给 定 需 
求 后 ， 进 入 系统 定义 阶段 ， 世 片 设 计 人 员 确 定 设计 参 
数 ， 并 完成 包括 结构 、 接 口 定义 等 具体 设计 。C@) Z 
辑 设 计 (logie design) 。 由 芯片 开发 人 员 根 据 系统 定 
义 进行 逻辑 设计 ， 通常 采 用 硬件 开发 语言 Verilog、 
VHDL 等 实现 芯片 的 人 硬件 代码 ， 包 括 其 中 各 个 功能 
模块 、 外 部 接口 和 整体 连接 。G@ 电路 设计 (circuit 
design) 。 在 得 到 芯片 的 硬件 程序 后 ， 世 片 开 发 人 员 
进行 电路 设计 ， 把 硬件 描述 转换 成 为 门 级 的 电路 表 


Lm. 


| 
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图 1 典型 芯片 设计 流程 
Figure 1 Typical flow of chip design 
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ZR, © 物理 设计 (physical design) 。 在 得 到 芯片 网 
表 之 后 ， 芯 片 开发 人 员 进 行 物理 设计 ， 把 门 级 网 表 转 
换 成 物理 实现 表示 ， 即 芯片 的 版 图 ; 其 常见 格式 为 
图 数据 表示 ， 即 graphic data systemI (GDSI ) . 5 
外 ， 蕊 片 开发 人 员 会 在 物理 设计 的 各 个 阶段 进行 验证 
测试 和 迭代 设计 ， 以 得 到 符合 需求 的 蕊 片 设计 。(5) 验 
。 最 终 完成 的 芯片 版 图 送 
至 代 工 厂 进行 制造 ， 后 续 青 进 封装 、 制 板 、 测 试 等 工 
序 ， 这 样 就 得 到 了 一 颗 完 整 的 芯片 。 
1.2 Chip Learning 

近 些 年 来 ， 以 深度 学 习 为 代表 的 AI 技术 再 次 兴 
盛 ， 已 经 在 很 多 任务 上 表现 出 卓越 的 效果 。 例 如 ， 
ResNet-512 深度 学 习 模 型 在 图 像 识 别 上 表现 出 超越 人 
I3 518877", DeepMind 公司 提出 的 AlphaGo 系列 模 
型 在 围棋 游戏 上 表现 超越 人 类 棋 力 中 。 人 研究 人 员 也 开 
始 研 究 将 最 新 的 AI 技术 应 用 到 芯片 设计 当中 ， 如 深度 
申 经 网 络 、 强 化 学 习 、 生 成 对 抗 网 络 等 。 这 一 方向 也 
受到 越 来 越 多 的 关注 。Cadence 公司 已 经 在 2020 年 发 
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是 表达 式 ， 也 可 以 是 真 值 表 。 这 个 问题 对 应 着 传统 世 
片 设计 流程 的 逻辑 设计 。C@) 逻辑 图 生成 。 当 有 了 准确 
表达 ， 第 2 个 重要 的 问题 就 是 要 生成 电路 的 逻辑 图 表 
达 ， 并 在 这 张 逻 辑 图 上 进行 优化 ， 最 后 生成 物理 无 关 
(包括 工艺 ) 的 逻辑 图 表达 。 这 个 问题 对 应 着 传统 心 
片 设计 流程 的 电路 设计 。(3) 物理 图 生成 。 当 有 了 电 
路 逻辑 图 后 ， 第 3 个 重要 的 问题 就 是 要 生成 电路 的 具 
体 物理 版 图 ， 这 等 价 于 一 种 多 种 约束 下 (如 面积 、 功 
耗 、 物 理 等 限制 ) 的 图 映射 和 优化 问题 。 这 个 问题 对 
应 着 传统 芯片 设计 流程 的 物理 设计 。 


2 芯片 学 习 在 心 片 设计 流程 中 需要 解决 的 
问题 
2.1 逻辑 设计 
逻辑 设计 的 核心 就 是 要 得 到 电路 的 硬件 描述 。 通 
常 这 一 过 程 通 过 人 工 完 成 ， 也 就 是 硬件 开发 人 员 采 
用 硬件 描述 语言 如 Verilog、VHDL 手动 编写 RTL 的 
硬件 程序 。 还 有 一 种 方法 就 是 高 层次 综合 ( HLS ) 。 


布 了 iSpatial 引擎 后 ， 以 支持 机 器 学 习 进 行 统一 布局 布 
线 和 优化 。Synopsys 公司 也 在 2019 年 推出 了 DSO.ai 工 
具 "， 其 基于 AI 技术 极 大 地 提升 了 芯片 设计 效率 。 
然而 ， 目 前 全 球 芯 片 设计 中 的 深度 学 习 工 作 还 主 
要 停留 在 采用 人 工 智 能 技术 去 辅助 解决 传统 芯片 设计 
流程 中 的 子 问题 ， 如 评估 、 预 测 芯片 设计 的 结果 等 。 
与 之 不 同 的 是 ， 本 文 提出 的 Chip Learning 技术 内 涵 则 
是 取代 传统 芯片 设计 流程 ， 通 过 AI 模型 学 习 专 业 知 
识 ， 从 而 实现 无 人 化 (no-man-in-the-loop ) 芯片 设计 
(图 2 ) 。 具 体 而 言 ， 类 比 传统 芯片 设计 流程 ，Chip 
Learning 可 以 分 成 3 个 重要 问题 : O 功能 生成 。 当 用 
户 用 模糊 的 语言 确定 了 系统 功能 ， 第 一 个 重要 的 问题 
就 是 根据 用 户 意 图 确定 系统 正确 的 功能 ， 并 生成 系统 
的 准确 表达 。 这 种 准确 表达 可 以 是 硬件 代码 ， 也 可 以 


D PAR, netlist. 


高 层次 综合 指 的 是 通过 高 层次 综合 工具 把 C、C++ 或 
者 SystemC 等 高 级 编程 语言 描述 的 硬件 功能 转化 成 
为 硬件 描述 语言 Verilog、VHDL 程序 。 传 统 高 层次 
综合 算法 一 般 通过 确定 性 的 方法 对 高 级 语言 进行 变 
换 。 近 些 年 来 ， 除 了 传统 的 机 器 学 习 算 法 如 支持 向 
量 机 (SVM ) ,最 新 的 人 工 智 能 技术 如 深度 神经 网 
络 (DNN) 、 图 神经 网 络 (GNN ) 也 被 用 于 高 层次 
综合 中 ， 主 要 用 于 帮助 更 快速 的 HLS 设计 结果 评估 
(EE, HERETO. EAA, I 
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图 2 芯片 学 习 流程 
Figure2 Design flow of Chip Learning 
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ifti") 和 FPGA 设 计 空间 搜索 优化 六。 

与 上 述 2 种 方法 相 比 ， 芯 片 学 习 更 进一步 : 当 用 
户 给 定 模糊 描述 后 ， 通 过 猜测 用 户 意图 自动 编写 硬件 
程序 ， 或 者 说 自动 生成 硬件 的 准确 表达 一 一 可 以 是 硬 
件 RIL 程序 ， 也 可 以 是 硬件 表达 式 ， 还 可 以 是 硬件 真 
值 表 。 这 其 中 面临 很 多 挑战 ， 如 用 户 意 图 的 确定 ， 硬 
件 表达 的 准确 性 等 。 在 该 方面 ， 程 序 综合 (program 
synthesis ) 一 一 自动 构建 由 指定 语言 构成 的 、 符 合用 
户 某 种 要 求 的 程序 ， 跟 芯片 学 习 的 功能 确定 问题 具有 
同样 的 形式 。 目 前 ， 程 序 综合 已 经 有 了 很 多 进展 可 供 
芯片 学 习 借 鉴 参考 。 
2.2 电路 设计 

在 得 到 芯片 的 硬件 描述 后 ， 芯 片 开 发 人 员 进 行 
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Inverter Graph 还 是 Majority-Inverter Graph 优化 器 "1。 
Haaswijk 等 (7 和 Zhu 等 中 把 逻辑 优化 问题 定义 成 马尔 
可 夫 决 策 过 程 (Markov decision process ) ， 采 用 深度 
强化 学 习 框 架 ， 图 卷 积 神经 网 络 作为 策略 ， 来 实现 逻 
辑 优化 。Hosny 等 '" 则 采用 强化 学 习 里 的 演员 -评论 家 
模型 ( A2C ) 来 寻找 时 序 约束 下 最 小 化 面积 开销 的 逻 
辑 最 小 化 方案 。Deep-PowerX 通过 DNN 来 预测 部 分 电 
路 采用 近似 电路 时 的 电路 输出 错误 率 ， 从 而 尽 可 能 地 
FEHLER BR SISSE 

世 片 学 习 在 这 个 阶段 要 解决 的 问题 是 逻辑 图 生 
成 ， 也 即 在 给 定 电路 的 硬件 描述 〈 如 RTL 程序 、 表 
达 式 或 真 值 表 ) 和 可 用 节点 类 型 的 约束 下 ， 生 成 电路 
相应 的 逻辑 图 。 在 该 逻辑 图 中 ， 节 点 是 门 、 宏 单元 、 


电路 设计 。 如 图 3 所 示 ， 在 电路 设计 中 ， 电 路 的 硬件 
描述 程序 会 被 转化 成 为 电路 图 ( 网 表 ) ， 这 个 过 程 
也 被 称 为 前 端 设 计 (front-end processing ) 或 者 综合 
( synthesis ) 。 

电路 设计 包含 2 个 核心 优化 步骤 : 逻辑 最 小 化 和 
物理 有 映射。 逻辑 最 小 化 指 对 电路 的 布尔 表达 式 和 巡 
辑 网 表 结 构 进行 化 简 ， 从 而 得 到 尽 可 能 小 的 逻辑 表 
达 式 。 物 理 映 射 则 是 在 给 定 物理 工艺 库 的 情况 ( 如 可 
用 的 门 的 种 类 、 标 准 单元 ) ， 把 逻辑 表达 式 映 射 到 这 
些 物理 单元 上 ， 生 成 尽 可 能 简单 的 物理 电路 。 当 前 ， 
芯片 设计 中 利用 AI 技术 可 实现 的 相关 工作 主要 集中 
在 这 2 个 核心 优化 步骤 上 。LSOracle 采用 深度 神经 网 
络 (DNN ) 去 动态 决定 电路 中 不 同 部 分 是 采用 And- 


< 
功能 验证 
RTL [ech Lib J Netlist 
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E3 芯片 设计 的 逻辑 设计 和 电路 设计 
Figure3 Logic design and circuit design in chip design 
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已 知 功能 模块 ， 连 线 是 有 方向 的 ， 表 示 信 号 从 一 端 流 
向 另外 一 端 。 如 果 是 时 序 电 路 ， 逻 辑 图 中 还 会 存在 环 
路 。 同 样 的 ， 在 该 逻辑 图 上 需要 做 优化 ， 以 尽 可 能 地 
去 掉 电 路 中 的 宛 余 ， 保 证 生成 的 逻辑 图 尽量 精简 。 
一 个 思路 是 采用 传统 编译 的 思路 完成 这 个 过 程 2f 
采用 上 文 类 似 的 GNN 和 增强 学 习 ( RL ) 方法 实现 图 
级 别 优化 。 另 外 一 个 思路 是 采用 神经 编译 器 (neural 
compiler ) 所 ， 直 接替 代 传统 的 编译 技巧 ， 把 输入 转化 
成 为 逻辑 图 并 在 图 上 做 进一步 的 优化 ， 从 而 得 到 更 简 
洁 的 逻辑 图 表达 。 
2.3 物理 设计 

在 得 到 芯片 网 表 之 后 ， 芯 片 开 发 人 员 开 始 进行 物 
理 设计 ; 其 把 门 级 网 表 转 换 成 物理 元 器 件 及 其 连 线 
并 固定 下 来 ， 最 后 得 到 芯片 的 版 图 。 物 理 设 计 流程 
比较 复杂 (图 4) ,不 同 工 艺 还 有 其 独特 的 地 方 ， 主 
要 包括 floorplan 设计 、 布 局 (placement) 、 时 钟 树 综 
A (CTS) 、 布 线 (route) 、 完 成 (finish) 。 在 开 
始 物理 设计 之 前 ， 设 计 人 员 需 要 先 确 定 物理 设计 环 
境 ， 包 括 设计 所 需要 的 物理 库 (physical library) 、 工 
艺 (technology file) 、 设 计 约束 库 (constraints file ) 
等 ; 芯片 设计 相关 的 参数 ， 包 括 设计 采用 的 工艺 、 
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芯片 采用 几 层 金属 、 
(fanout ) 等 。 

物理 设计 本 身 流 程 多 、 复 杂 ， 子 问题 也 多 ， 因 此 
采用 AI 技术 解决 其 中 子 问 题 的 研究 工作 也 相对 多 一 


最 小 线 间 距 、 所 允许 的 最 大 局 出 
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功 耗 分 析 方 面 。Barboza 等 "用 随机 森林 方法 使 时 序 分 
析 可 以 脱离 手工 特征 进行 ， 同 时 减 小 布线 前 时 序 估计 
的 误差 。Ambasana $P. Lu, Goay 和 Goh? HY 
多 篇 工作 都 以 眼 图 的 宽 高 用 神经 网 络 为 基础 预测 电路 


些 。 在 布局 中 ，AI 技 术 主 要 被 用 来 生成 更 好 的 布局 
和 预测 布局 后 的 结果 。 例 如 ， 在 2021 年 发 表 的 电路 
后 端 设 计 自动 化 的 工作 中 ， 谷 歌 把 布局 问题 形式 
化 为 序列 决策 问题 ， 从 而 利用 强化 学 习 的 方法 来 解 
W, AR 6 小 时 即 可 生成 具有 媲美 或 超过 人 工 的 现代 
加 速 器 网 表 上 的 布局 。He 和 Bao™ 使 用 强化 学 习 训 


信号 串扰 或 抖动 。 

芯片 学 习 对 应 的 子 问题 是 物理 图 生成 。 可 以 看 
到 ， 在 物理 设计 的 多 个 阶段 ，AI 技 术 被 广泛 地 用 来 畏 
助 解决 其 中 的 子 问题 ， 蕊 片 学 习 则 期 望 能 够 直接 端 到 
端 得 到 一 个 最 终 的 物理 版 图 。 这 个 子 问题 的 难度 可 想 
而 知 ， 其 中 涵盖 了 多 个 子 问题 ， 也 极 有 可 能 需要 多 个 


练 一 个 Agent 帮助 选择 空间 搜索 时 下 一 步 访问 的 邻居 
节点 ， 用 以 指导 生成 更 好 的 布局 。 在 时 钟 树 综合 中 ， 

AI 技术 的 应 用 主要 关注 对 生成 的 时 钟 树 做 优化 或 预 
测 。Lu 等 "提出 采用 生成 对 抗 网 络 (GAN ) 和 强化 学 
习 来 预测 、 优 化 生成 的 时 钟 树 ， 从 而 降低 时 钟 漂移 和 
时 钟 树 长 度 。Nagaria M Deb”, Kwon yR H 
卷 积 神经 网 络 (CNN) 、DNN 来 预测 时 钟 树 组 件 ， 
如 gatingg 单元 、buffer 数量、wireloads 等 ， 从 而 帮助 
提高 时 钟 树 质量 ， 降 低 时 钟 树 长 度 、 时 钟 漂移 等 。 

在 布线 中 ， 人 工 智能 技术 主要 被 用 来 布线 结果 预测 
和 评估 。Liang 等 2 和 Alawieh 等 2 将 问题 化 为 image- 
to-image 问题 ， 分 别 用 CNN 和 条 件 生成 对 抗 网 络 
( CGAN ) 进行 布线 堵塞 预测 。 在 完成 阶段 ，AI 技 术 
主要 用 于 验证 测试 中 的 时 序 分 析 、 信 和 号 完整 性 分 析 和 


D 


模型 协同 进行 工作 ， 才 有 可 能 最 终 解决 。 利 用 芯片 学 
习 端 到 端 得 到 最 终 物 理 版 图 的 挑战 主要 有 2 个 方面 : 
(D 问题 和 约束 形式 化 较为 困难 。 正 如 上 面世 片 物 理 设 
计 流 程 中 所 介绍 的 一 样 ， 问 题 本 身 的 输入 是 类 似 网 表 
的 逻辑 图 ， 最 终 输 出 的 是 物理 版 图 。 不 同 规模 的 电路 
蕴含 的 功能 也 不 一 样 ， 这 就 意味 着 统一 的 模型 能 够 处 
理 变 长 、 变 规模 的 输入 和 输出 。 另 外 ， 物 理 设计 中 的 
约束 也 是 多 种 多 样 的 ， 包 括 : 世 片 本 身 的 最 大 面积 
所 能 容忍 的 最 大 延迟 等 基本 约束 ， 以 及 电源 网 络 构 
建 、crosstalk 消除 、 天 线 效 应 等 约束 。 这 些 约束 需要 
变 成 结构 化 的 信息 从 而 可 以 被 人 工 智 能 模型 所 接受 ， 
也 即 计 合理 的 数据 结构 ， 这 也 是 非常 困难 的 。@ 问题 
对 应 的 解 空间 规模 大 。 电 路 物理 设计 过 程 中 本 身 就 包 

含 了 很 多 复杂 度 很 高 甚至 于 是 NP 完全 问题 ”>， 这 也 就 
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图 4 ”芯片 设计 的 物理 设计 流程 
Figure 4 Physical design process in chip design 


© 即 多 项 式 复杂 程度 的 非 确 定性 问题 ,是 世界 七 大 数学 难题 之 一 。 
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意味 着 物理 设计 本 身 是 一 个 随 着 规模 增 大 复杂 度 急 剧 
上 升 的 问题 。 

对 于 解决 世 片 学 习 物 理 版 图 生成 这 个 非常 困难 
的 问题 ， 目 前 已 经 看 到 了 一 些 明光。 谷歌 使 用 RL 和 
GNN 替代 了 传统 的 布局 过 程 ，Liao y^", He Fil Bao" 
也 提出 了 直接 替代 布线 过 程 的 小 规模 电路 上 的 方案 ， 
从 而 证 明了 AI 技术 在 传统 问题 上 大 有 可 为 。 物 理 版 图 
最 终 是 要 针对 工艺 的 ， 而 值得 庆幸 的 是 ， 现 在 芯片 设 
计 流 程 中 的 设计 规则 是 抽象 出 来 与 工艺 无 关 的 约束 规 
则 ， 这 也 将 是 芯片 学 习 解 决 方案 未 来 能 够 泛 化 到 不 同 
工艺 上 的 基础 。 

2.4 验证 测试 

验证 测试 贯穿 整个 芯片 设计 流程 。 在 不 同 阶段 ， 
芯片 开发 人 员 都 需要 对 得 到 的 设计 进行 反复 验证 ， 如 
功能 测试 验证 、 逻 辑 测试 验证 、 电 路 测试 验证 、 网 表 
测试 验证 、 版 图 测试 验证 。 

对 于 芯片 学 习 而 言 ， 验 证 测试 核心 要 解决 的 挑战 
就 是 黑 盒 解决 方案 的 精度 保证 。 现 有 的 AI 技术 虽然 能 
在 很 多 问题 上 达到 很 好 的 效果 ， 但 其 为 人 所 诉 病 的 一 
点 就 在 于 这 些 黑 盒 模型 缺乏 可 解释 性 ， 对 于 输出 结果 
的 精度 也 无 法 给 出 理论 的 保证 。 这 一 点 对 于 芯片 学 习 
尤其 重要 ， 因 为 芯片 流 片 的 成 本 非常 高 ， 即 使 未 来 在 
工程 上 芯片 学 习 能 够 解决 问题 ，AI 新 技术 的 可 解释 性 
也 需要 继续 深入 研究 。 


3 未 来 工作 


芯片 学 习 是 万 物 互 联 的 智能 时 代 解 决 芯片 设计 需 
求 大 和 代价 高 之 间 了 矛盾 的 核心 方法 。 目 前 ，AI 新 技术 
在 芯片 设计 流程 中 已 经 得 到 应 用 〈 表 1 ) ， 然 而 这 些 
工作 都 还 是 集中 在 芯片 设计 各 个 环节 当中 的 子 问题 ， 
主要 是 辅助 传统 设计 流程 ， 完 成 预测 、 评 佑 方面 的 功 
能 ， 尚 未 实现 AI 取代 传统 芯片 设计 流程 ;芯片 学 习 
则 是 希望 能 够 完全 取代 传统 芯片 设计 流程 ， 用 AI 模 
型 学 习 专 家 知识 ， 大 幅度 降低 蕊 片 设计 门槛 ， 提 升 
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表 1 Al 新 技术 在 心 片 设计 流程 中 的 应 用 
Table 1 AIalgorithms in chip design 


阶段 主要 问题 主要 方法 

设计 结果 评估 ANN®""!, CNN”! 
XB 

设计 空间 搜索 优化 ANN"?! 

逻辑 最 小 化 DNNL9 Rp) GCN"""8 
电路 设计 

BERS DNN 

布局 一 生成 、 预 测 、 评 估 R 

时 钟 树 综合 一 预测 评估 CNNE4,DNNB9 


布线 一 布线 生成 RL?" DNN 


物理 设计 


布线 一 结果 预测 、 优 化 — CNN”, GAN™ 
完成 一 时 序 分析 RF 
完成 一 信号 完整 性 分 析 


ANN’? 


ANN: 人 工 神 经 网 络 ; DNN: 深度 神经 网 络 ; CNN: 卷 积 神经 网 
络 ; GNN: 图 神经 网 络 ; GCN: 图 卷 积 神经 网 络 ; RL: 增强 学 习 ; 
RF: 随机 森林 ; SVM: 支持 向 量 机 ; LR: 线性 回归 ; GAN: 生成 
对 抗 网 络 

ANN: Artificial Neural Network; DNN: Deep Neural Network; CNN: 
Convolutional Neural Network; GNN: Graph Neural Network; GCN: Graph 
Convolutional Neural Network; RL: Reinforcement Learning; RF: Random 
Forest; SVM: Support Vector Machine; LR: Linear Regression; GAN: 
Generative Adversarial Network 


芯片 设计 效率 ， 从 而 实现 端 到 端的 快速 无 人 化 芯片 设 
Ws 

芯片 学 习 未 来 有 3 点 主要 工作 。@ 四 全 流程 。 芯 片 
学 习 在 各 个 流程 上 实现 取代 传统 算法 ， 同 时 在 各 个 流 
程 中 消除 人 的 参与 ， 从 而 实现 芯片 设计 全 流程 无 人 化 
以 节省 人 力 资 源 ， 实 现 高 效率 的 芯片 设计 。C@) 跨 层 次 
优化 。 利 用 芯片 学 习 ， 和 希望 将 芯片 设计 各 个 环节 打通 
实现 蜂 层 次 设计 与 优化 ， 实 现 大 规模 芯片 统一 设计 ， 
从 而 实现 更 优 的 芯片 设计 。(@) 并 行 加 速 。AI 技 术 以 计 
算 量 大 、 数 据 量 大 著称 ， 而 芯片 设计 又 是 非常 复杂 的 
任务 ， 芯 片 学 习 也 需要 研究 并 行 和 加 速 方法 。 例 如 ， 
采用 已 经 莲 勃 发 展 的 人 工 智 能 芯片 ， 从 而 保证 芯片 设 
计 效 率 。 未 来 ， 芯 片 学 习 和 希望 实现 从 设计 芯片 到 自动 
生成 芯片 的 转变 ， 更 好 地 支撑 智能 万 物 互 联 时 代 的 应 
用 需求 。 
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Chip Learning: 从 忆 片 设计 到 心 片 学 习 


From Chip Design to Chip Learning 


CHEN Yunji”  DUZidong GUOQi' LI Wei’ TAN Yijun" 
(1 State Key Laboratory of Computer Architecture, Institute of Computing Technology, Chinese Academy of Sciences, 
Beijing 100190, China; 

2 School of Computer Science and Technology, University of Chinese Academy of Sciences, Beijing 100049, China ) 
Abstract Chip is the foundation of the modern information society. As the world is entering a new era of human-cyber-physical ternary 
computing, with diverse intelligent applications over trillions of devices, chip with specialized architecture will be heavily demanded in both 
numbers and types. However, chip design is very costly, which usually requires a long design cycle, complicated process, and high professional 
developers. Hence, there is a large gap between the need of tremendous chips and the high cost of chip design in the new era. This study 
proposes Chip Learning, a learning-based method to perform the entire chip design, including logic design, circuit design, and physical design. 
As an alternate to chip design, Chip Learning aims to remove the barrier of professional knowledge and experiences for effective chip design 


with a no-human-in-the-loop process in a short time. 
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